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摘 Z. [目的 /意义 ] 新 兴 技 术 识 别 有 助 于 国家 、 企 业 等 把 握 技术 前 沿 、 发 现 技术 机 会 、 抢 占 市 场 先 机 、 创 造 社会 价值 。 梳 
理 新 兴 技 术 识 别 的 研究 进展 ,以 期 为 新 兴 技 术 识 别 研究 提供 参考 。[ 方法 “过程 ] 在 明确 新 兴 技 术 概 念 和 特征 的 
基础 上 ,详细 介绍 基于 关系 网 络 的 新 兴 技 术 识别 方法 ,并 从 新 兴 技 术 识 别 的 网 络 节点 、 网 络 关系 、 测 度 指标 进行 总 
结 , 对 未 来 新 兴 技 术 识别 研究 提出 建议 。[ 结果 /结论 ] 基 于 关系 网 络 的 新 兴 技 术 识别 方法 包括 基于 引用 关系 、 共 
现 关系 以 及 相似 度 关系 的 方法 ,新 兴 技 术 识别 的 网 络 节点 主要 来 自 论 文 和 专利 数据 , 现 有 指标 体系 包括 文献 计量 


学 指标 和 网 络 结构 特征 指标 。 未 来 ,新 兴 技 术 识别 研究 可 以 从 丰富 数据 源 、 网 络 关系 融合 测度 指标 等 方面 进行 
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改进 ;同时 ,重点 加 强 对 新 兴 技 术 识别 中 多 源 数据 和 多 元 关系 的 融合 网 络 的 探索 。 


个 维度 梳理 新 兴 技 术 识 别 方法 ,重点 介绍 基于 网 络 科 
学 和 科技 图 谱 的 方法 ,但 其 仅 描述 了 不 同 网 络 的 含义 ; 


和 当前 科技 革命 和 产业 变革 方兴未艾 ,国际 形势 复 
克 多 变 ,如 何 更 好 地 识别 新 兴 技术 ,对 我 国 未 来 的 安全 
和 科技 创新 发 展 至 关 重 要 。2011 年 ,美国 国家 情报 高 
级 三 究 计划 局 资助 的 “科学 展望 前 瞻 计 划 (FUSE) " 
鲁 纵 开发 自动 化 方法 ,利用 已 发 表 的 科学 .技术 和 专利 
文 扇 中 的 信息 ,对 新 兴 技术 进行 系统 .持续 和 全 面 的 评 
估 志 欧盟 的 PromTech 项 目 中 致力 于 通过 对 科学 文献 
的 全 析 来 定位 新 兴 技 术 。2020 年 3 月 ,北约 科学 技术 
组 织 发 布 了 《科学 和 技术 趋势 :2020 - 2040》” ,该 报告 
集成 多 个 国际 机 构 组 织 关于 颠覆 性 技术 的 测量 工具 和 
指标 ,对 未 来 20 年 世界 新 兴 和 颠覆 性 技术 进行 了 识别 
与 预测 。 

在 技术 变革 的 浪潮 下 ,新兴 技 术 的 形成 过 程 和 依 
赖 关系 较为 复杂 ,导致 其 识别 难度 较 大 ,因此 如 何 准确 
地 识别 新 兴 技 术 是 科技 创新 领域 的 重点 和 难点 问题 。 


卢 小 宾 等 ”从 计量 与 演化 视角 归纳 新 兴 技 术 识别 的 特 
征 ,数据 表示 和 识别 方法 ,其 中 提出 更 多 基于 关系 融合 
网 络 的 新 兴 技 术 识 别 研究 出 现 ,但 未 对 这 方面 进行 详 
细 描 述 。 

新 兴 技 术 识别 方法 较为 宽泛 ,关系 网 络 是 其 中 一 
种 重要 方法 。 因 此 ,本 文 聚焦 基于 关系 网 络 的 新 兴 技 
术 识别 方法 ,首先 ,检索 国内 外 相关 文献 ,系统 梳理 新 
兴 技 术 的 概念 ;其 次 ,重点 对 现 有 基于 关系 网 络 的 新 兴 
技术 识别 方法 进行 总 结 与 归纳 ,对 比分 析 各 种 方法 的 
优 劣 势 以 及 使 用 场景 ;最 后 ,提出 新 兴 技 术 识别 未 来 在 
多 源 数据 节点 、 多 元 关系 网 络 和 多 维 指标 体系 可 能 的 
发 展 方向 ,以 期 为 相关 学 者 的 进一步 研究 提供 参考 与 


HE 
BE. 


2. 新兴 技 术 的 概念 与 特征 


目前 ,已 有 学 者 对 新 兴 技 术 相 关 研 究 展开 述评 , 侯 剑 华 
等 ” \ 周 萌 等 5” CEDAR" 、 刘 小 玲 等 “学 者 从 新 兴 

术 的 概念 .管理 实践 进行 总 结 ,或 从 定性 定量 的 角度 对 
识别 方法 进行 划分 ,但 少 有 从 关系 网 络 视角 的 角度 进 
行 系统 深入 的 分 析 。 徐 建国 等 ”从 时 间 、 数 据 关联 两 


在 Web of Science 中 ,借鉴 D，Rotolo 等 5 的 检索 
策略 ,设置 检索 式 : TS = ("emerg* technolog * " or" 


" " 


technolog * emerg* " or "emerg * of* technolog * " or 


" " 


"emerg * scien * technolog * " or "emerg * topic * " or 


"emerg * of * topic * "), 25| = (SC-EXPANDED, 
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SSCI) ,时 间 跨 度 = 所 有 年 份 ,并 限定 社会 科学 领域 期 
刊 , 共 搜 集 得 到 449 篇 文献 。 在 中 国 知 网 中 ,检索 主题 
=“ 新 兴 技 术 识别 + 新 兴 主 题 识别 ”, 来 源 类 别 = 北大 
核心 + CSSCL, 发 表 时 间 = 不 限 , 共 检索 到 64 篇 文献 。 
通过 人 工 判读 筛选 ,最 终 得 到 56 篇 文献 ,并 在 阅读 文 
献 的 过 程 中 ,通过 参考 文献 补充 相关 文献 。 经 过 阅读 
发 现 一 些 学 者 未 对 新 兴 技 术 和 新 兴 主 题 进行 严格 区 
分 , 且 部 分 新 兴 主 题 识别 的 研究 方法 与 新 兴 技 术 识 别 
方法 类 似 , 所 以 将 这 部 分 关于 新 兴 主 题 识别 的 研究 方 
法 也 纳入 本 文 范 围 。 

G. S. Day 等 由 在 其 代表 性 著作 Wharton on Man- 
aging Emerging Technologies 中 将 “新 兴 技 术 ” 定 义 为 基 
于 科学 的 创新 ,这 些 创新 具有 创造 新 产业 或 改造 现 有 


产业 的 潜力 。 国 内 华 宕 鸣 等 ”从 商业 化 的 角度 定义 
“新 兴 技 术 ”, 认 为 新 兴 技 术 指 未 被 商业 化 的 ,但 在 3 - 
5 年 内 能 被 商业 化 的 技术 ,或 是 现在 已 经 被 应 用 但 将 
会 发 生 明 显 变化 的 技术 。 

新 兴 技 术 概念 被 提出 后 ,国内 外 学 者 、 机 构 从 不 同 
角度 对 新 兴 技 术 进 行 概念 界定 ,一 是 从 新 兴 技 术 的 产 
生 和 发 展 的 角度 阐述 其 在 技术 上 的 创新 ,强调 时 间 和 
内 容 上 的 “新 " ;二 是 关注 新 兴 技 术 的 正在 兴起 、 不 断 
涌现 或 变 车 可 能 会 对 未 来 产业 市 场 的 发 展 产 生 重 大 
的 影响 ,强调 效应 层面 的 “ 兴 ” ;三 是 更 多 学 者 立足 G. 
S. Day 等 的 理论 ,综合 技术 和 效应 两 个 角度 对 新 兴 技 
术 进 行 界定 ,如 表 1 所 示 : 


T- 表 1 新 兴 技 术 概 念 

INRE 代表 学 者 概念 界定 

CCHCRBE H. Smal 等 [niA 。 新 的 并 且 快速 增长 的 技术 

N Breitzman 等 [14] 。 有 高 速 发 展 的 潜力 ,可 能 开辟 新 的 技术 和 科学 领域 

人 效应 角度 E GRUSS Lo Alexander © 正在 涌现 ,发 展 和 扩散 的 技术 ,具有 蓬勃 的 发 展 趋势 和 较 大 商业 潜能 ,可 能 在 未 来 对 行业 经 济 产生 
© a016]; A, L. Poner 等 [17]，; 较 大 影响 

Es M. Halgseh 18] 。 未 来 10 至 15 年 内 具有 社会 相关 性 的 技术 

。 能 够 对 经 济 和 社会 产生 潜在 影响 

。 对 工业 商业、 社会 产生 彻底 改变 的 技术 


人 全 术 属 性 和 G. S. Day 4011]; S, Cozzens © 基于 科学 的 创新 ,具有 创造 新 产业 或 改造 旧 产 业 的 潜力 


cuum 度 al] ; 李 仕明 等 [20],D，Rotole © 快速 增长 .新颖 性 \ 未 开发 的 市 场 潜力 和 高 科技 基础 

= 等 [101， 徐 建国 等 [591;, up zn O 建立 在 多 学 科 发 展 基础 上 ,具有 潜在 产业 前 景 和 高 度 不 确定 性 ,正在 涌现 并 可 能 导致 产业 等 变革 
N 文 等 CH 。 激进 的 新 颖 性 .相对 快速 的 增长 ,连贯 性 、 突 出 的 影响 .不 确定 性 和 模糊 性 

LI 。 知识 生产 过 程 中 产生 的 相对 快速 发 展 的 根本 性 创新 技术 ,具有 影响 未 来 经 济 和 社会 发 展 的 潜力 
一 。 可 能 会 对 市 场 格局 和 行业 发 展 产生 持续 性 影响 ,甚至 演化 成 改变 已 有 技术 范式 和 技术 轨迹 的 突破 
`€ 性 创新 ,也 可 能 仅 是 县 花 一 现 

© 


Caius Li ,新兴 技术 虽 未 达成 统一 的 概念 ,但 以 上 
ESL 部 主要 着 眼 于 “新 "和 " 兴 " 两 个 字 , 体 现 出 新 兴 
术 铭 本质 特征 :新 颖 性 增长 性 .持续 性 ,社区 性 ,影响 
性 和 不 确定 性 ""。 其 中 ,新 颖 性 .快速 增长 性 和 影响 
性 是 学 者 们 进行 新 兴 技 术 识 别 的 关键 特征 。 近 年 来 ， 
学 者 也 会 纳入 其 他 特征 来 进行 综合 判断 。 

新 兴 技 术 的 出 现 受到 技术 市场. 经济 、 人 才 等 多 
因素 影响 ,可 能 源 于 从 0 到 1 的 重大 科技 突破 ,也 可 能 
源 于 已 有 技术 的 重组 或 应 用 。 在 新 兴 技 术 的 发 展 过 程 
中 ,会 发 生 科学 或 者 技术 的 动态 关联 ,也 就 是 说 , 随 着 
时 间 的 演进 ,实体 间 以 共 现 . 引 用 、 相 似 度 或 其 他 方式 
产生 关联 ,形成 的 关联 网 络 动态 扩展 ,在 一 定 程度 上 可 
以 代表 知识 的 流动 与 扩散 ,从 而 衍生 新 兴 技 术 。 因 此 ， 
新 兴 技 术 往 往 是 以 复杂 网 络 的 形式 呈现 ,在 新 兴 技 术 
识别 中 引入 网 络 分 析 的 思想 ,通过 融合 路 径 权重 .节点 
特征 等 信息 ,可 以 帮助 识别 新 兴 技 术 。 同 时 ,网 络 分 析 
等 方法 的 发 展 为 开展 新 兴 技术 识别 工作 提供 了 分 析 工 


具 的 支持 。 
3 基于 关系 网 络 的 新 兴 技术 识别 方法 


从 广义 概念 来 看 ,新 兴 技 术 识别 是 技术 预测 的 其 
中 一 个 研究 问题 。 技 术 预 测 是 描述 一 项 技术 在 未 来 某 
个 时 候 的 产生 、 表 现 、 特 征 或 影响 的 系统 过 程 ” ;新 兴 
技术 识别 则 是 依据 技术 发 展 的 基本 原理 以 及 科学 的 方 
法 ,探测 哪些 技术 是 新 兴 的 ,以 此 为 技术 创新 决策 提供 
支持 。 新 兴 技 术 预 测 既 可 以 是 对 某 个 技术 领域 内 的 新 
兴 技 术 识 别 ,也 可 以 是 对 某 类 特定 技术 的 演化 轨迹 刻 
画 与 趋势 分 析 呈 1。 

研究 者 通过 构建 网 络 进行 新 兴 技 术 识 别 和 预测 研 
5E ,结合 新 兴 技 术 的 特征 .数据 外 部 特征 、 网 络 结构 特 
征 等 ,建立 新 兴 技 术 识 别 指标 体系 ,并 以 某 一 领域 为 例 
进行 实证 研究 ,验证 指标 体系 和 方法 的 有 效 性 。 目 前 
这 种 框架 被 国内 外 学 者 广泛 地 应 用 于 新 兴 技 术 的 识别 
工作 中 ,如 图 1 所 示 : 
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UAD, 王 丽 . 关系 网 络 视角 下 新 兴 技 术 识别 研究 进展 [Jj. 图 书 情报 工作 ,2022,66(11) :139 - 150. 


技术 实体 技术 关系 网 络 此 标 体系 构建 ipe ds 
科技 信息 i us a =>] 。 指标 体系 构建 |l aN 
3 新 兴 技术 特征 
数据 特征 
共 || 引 || f 
现 | | 用 
网 络 结构 特征 


图 1 新 兴 技 术 识别 框架 


其 中 ,如 何 用 适当 的 实体 .关系 来 表示 待 分 析 的 技 
术 关系 网 络 是 一 个 重要 问题 ”。 网 络 的 节点 可 以 是 技 
术 文 档 .主题 或 关键 词 等 不 同 粒度 的 实体 ,也 可 以 是 文 
献 专 利 分 类 代码 ,发 明 人 /作者 或 机 构 等 不 同类 型 的 实 
体 。 节 点 间 的 连 边 表示 了 实体 间 的 关联 方式 , 连 边 权 
重 反映 不 同 主题 之 间 的 关联 程度 。 由 于 节点 的 粒度 或 
类 型 较为 丰富 且 易 操控 ,本 文 以 节点 间 的 关系 为 划分 


做 注 , 将 技术 关系 网 络 分 为: 引用 关系 网 络 (包括 引用 、 


等 局 在 此 基础 上 ,选用 合适 的 方法 综合 分 析 关系 网 络 ， 
以 到 准确 地 识别 新 兴 技术 。 

CD 基于 引用 关系 网 络 的 新 兴 技 术 识 别 方法 

5 科技 文献 之 间 的 引用 关系 直观 展现 了 它们 之 间 的 
知 遇 关联 关系 ,通过 分 析 引 用 关系 网 络 ,并 结合 时 序 分 
条 以 用 来 识别 和 预测 新 兴 技 术 * ( 见 表 2) 。 实 体 
间 欧 引用 关系 主要 包括 :直接 引用 (Direct citation) 关 


ARA (Coupling) 关系 AHA (Co-citation) 关系 。 


忆 在 引文 方法 中 ,假定 施 引 论文 和 被 引 的 论文 具有 
类 候 的 研究 主题 ,通过 对 引用 关系 网 络 进行 聚 类 得 到 
研 神主 题 , 并 结合 评价 指标 识别 新 兴 技术 主题 是 一 种 
常见 的 方法 。 其 中 , 共 被 引 网 络 分 析 方法 起 源 已 久 ， 
H. Small 等 ” 利用 共 被 引 关系 网 络 聚 类 分 析 得 到 文 
献 科 ,揭示 科学 领域 内 的 “高 水 平 活动 "。C，Chen ™ 
将 突 发 词 检测 整合 到 CiteSpace 工具 中 ,用 以 检测 术语 
和 共 被 引 论文 秘 构 成 的 异 质 网 络 中 的 新 兴 主 题 趋势 。 
HSmall ”在 三 个 连续 时 间 切 片 对 论文 共 引 网 络 进行 
多 次 聚 类 ,测度 研究 领域 的 出 现 和 发 展 ,并 预测 其 近期 
变化 。 

关于 直接 引用 网 络 聚 类 分 析 的 方法 ,Y，Kajikawa 
等 ”对 论文 引用 网 络 中 的 最 大 连通 子 图 进行 拓扑 聚 
类 ,计算 每 个 集群 的 平均 出 版 年 份 以 追踪 能 源 研究 中 
的 新 兴 技术 ,帮助 政策 制定 者 和 研发 管理 人 员 进 行 技 
术 创 新 投资 。 同 年 ,Y，Kajikawa 等 ”基于 该 方法 ,并 
通过 计算 集群 中 论文 的 平均 被 引 次 数 测度 集群 的 影响 
力 ,识别 生物 质 和 生物 燃料 领域 的 新 兴 技术 ,为 科学 技 


术 领 域 的 发 展 提出 建议 。 该 作者 所 在 团队 的 N.Shi- 
bata 等 改进 了 上 述 方法 ,通过 分 析 每 个 集群 的 平均 年 
龄 和 父子 关系 发 现 新 兴 趋 势 , 并 采用 拓扑 度量 (集群 度 
和 参与 系数 ) 探 测 是 否 存 在 新 兴 集 群 ,对 毛 化 锭 和 复杂 
网 络 ”以 及 再 生 医学 领域 ”等 多 个 领域 进行 了 实证 
研究 。H. Small 等 所 :将 共 引 用 和 直接 引用 聚 类 方法 
相 结合 ,形成 用 于 检测 新 兴 主 题 的 大 规模 数据 集 。Y. 
Zhou 4& 7 从 技术 融合 的 视角 ,构建 生物 技术 和 信息 技 
术 领 域 间 的 论文 引用 网 络 ,使 用 CDA 软件 集成 的 New- 
man 拓扑 聚 类 算法 将 引文 网 络 划分 为 不 同 的 集群 , 采 
用 LDA 算法 分 析 融 合 聚 类 的 主题 。 

O. Kuusi 和 M. Meyer? 认为 专利 耦合 分 析 相 比 
共 引 分 析 具 备 更 强 的 时 效 性 ,适用 于 预测 技术 突破 。 
李 蓓 和 陈 向 东 "” 提出 专利 引用 耦合 聚 类 分 析 是 识别 
新 兴 技 术 的 重要 方法 ,以 美国 专利 商标 局 授权 数据 库 
为 数据 源 ,计算 纳米 专利 间 的 耦合 强度 并 进行 聚 类 分 
析 , 对 各 个 类 的 授权 时 间 ,增长 率 和 权利 要 求 项 数 综合 
分 析 识别 出 新 兴 技术 。 

近年 来 ,引文 网 络 分 析 方法 在 新 兴 技 术 识 别 方面 
得 到 了 广泛 的 应 用 ,学 者 们 还 把 复杂 网 络 分 析 方法 E 
路 径 分 析 方 法 .遗传 模型 等 引入 技术 识别 中 ,与 引文 网 
络 分 析 方法 结合 做 出 新 的 演绎 。T. S. Cho 和 H. Y. 
Shih™ xf 1997 -2008 年 间 的 专利 进行 引用 网 络 分 析 ， 
采用 结构 洞 指标 以 识别 新 兴 技 术 。J. C. Ho 等 ”在 
论文 引用 网 络 中 采用 主 路 径 分 析 来 确定 燃料 电池 技术 
的 最 新 发 展 趋势 以 及 相关 技术 障碍 和 突破 性 解决 方 
案 , 并 通过 论文 增长 曲线 分 析 来 预测 燃料 电池 技术 的 
生命 周期 阶段 。S. Zhang 和 FF. Han^" 基于 专利 直接 
引用 聚 类 结果 识别 技术 的 新 颖 性 ,采用 遗传 模型 计算 
专利 的 影响 力 , 选 择 同时 满足 两 个 条 件 的 聚 类 作为 太 
阳 能 光伏 领域 的 新 兴 主 题 。H，Xu 等 “认为 一 个 主 
题 对 社区 网 络 的 影响 程度 越 大 ,表明 该 主题 的 不 确定 
性 和 模糊 性 越 小 ,因此 通过 分 析 主 题 在 不 同时 间 段 的 
引用 网 络 中 的 地 位 变化 ,作为 新 兴 研 究 主 题 不 确定 性 
和 模糊 性 的 测度 指标 。 但 该 研究 仅 采 用 网 络 节点 的 拓 


141 


&Q 44i xt 


$866 35 58 11 期 2022 *£6 H 


ChinaXiv 合 作 期 刊 


扑 结构 检测 不 确定 性 ,不 确定 性 降低 的 实际 评估 远 比 
拓扑 分 析 复 杂 , 通常 受 更 多 因素 (如 政策 .道德 和 机 


会 ) 的 影响 。 


表 2 引用 网 络 下 新 兴 技术 识别 方法 


研究 文献 研究 问题 网 络 节点 网 络 关系 方法 
Y. Kajikawa, N. Shibata, Y. ”使 用 引用 网 络 分 析 跟 踪 科 技 文献 中 的 新 兴 研 究 论文 直接 引 Newman 拓扑 聚 类 、 平 均 年 龄 
Takeda 等 [28-31,39] 领域 和 父子 关系 .拓扑 度量 (集群 
度 、 参 与 系数 ) 
H. Small 等 [13] 把 独立 运行 的 两 种 基于 引用 的 方法 (直接 引 论文 混合 (直接 引用 。 聚 类 ,新 兴 潜 力 函 数 
聚 类 和 共 引 线程 ) 组 合 在 一 起 ,以 识别 科学 和 技 + 共 被 引 ) 
术 领 域 的 新 兴 话 题 
Y. Zhou 4132] 通过 引用 网 络 揭 示 科学 知识 的 融合 过 程 以 预 论文 直接 引用 FN 算法 聚 类 , 隐 含 狄 利克 雷 
新 兴 技 术 分 布 (LDA) ,可 视 化 
O. Kuusi 和 M. Meyer[331 Æ ”基于 专利 引用 耦合 聚 类 的 新 兴 技术 识别 模型 及 专利 耦合 聚 类 分 析 , 指标 体系 , 自然 语 
dign 指标 体系 ,对 纳米 技术 领域 进行 实证 分 析 言 处 理 
T.S. Cho WiH.Y. ShihCS! ”分析 专利 引用 网 络 ,采用 网 络 指标 以 识别 新 兴 ”国际 专利 分 类 直接 引用 网 络 指标 ( 中心 度 、 结 构 洞 ) 
技术 (IPC) 
JaC. Ho 等 135] 对 引用 网 络 进行 主 路 径 分 析 ,确定 燃料 电池 技术 论文 直接 引 主 路 径 分 析 
w 的 最 新 发 展 趋势 


加 以 上 基于 引用 关系 网 络 的 新 兴 技术 识别 研究 ,其 
请 好 的 技术 路 线 是 对 引用 网 络 进行 聚 类 ,识别 技术 主 
网 > 乍 立 单 维 或 多 维 指标 识别 新 兴 技 术 , 利 用 数量 预测 
新 举 技 术 的 发 展 趋 势 。 该 方法 被 广泛 使 用 ,但 仍 存在 
-潜在 问题 。 首 先 ,这 种 方法 存在 时 间 上 的 滞后 性 ， 
5 潭 或 文献 的 被 引 次 数 与 其 发 表 的 时 长 有 关 。 基 于 引 
用 3% 系 的 方法 探寻 出 来 的 结果 更 趋 于 热点 (Emerged) 
TERRAE (Emerging) 技术 。 对 于 “ Emerging" 的 技 
术 3 与 其 相关 的 专利 或 论文 可 能 数量 上 较 少 ,时 间 上 和 较 
鞠 堵 引 频 次 相对 较 低 ,单一 的 引用 关系 较 难 捕 提 和 稀 
量 器 兴 技 术 。 此 外 ,目前 多 数 引用 分 析 仅 考虑 引用 关 
系 距 引 用 频次 , 较 少 考虑 论文 或 专利 文献 之 间 的 文本 
关 允 ,没有 全 面 利用 文献 特征 来 更 有 效 地 识别 新 兴 
技术 。 

3.2 基于 共 现 关系 网 络 的 新 兴 技术 识别 方法 

基于 实体 间 的 共 现 关系 ,以 实体 为 节点 .实体 共 现 
强度 为 边 权 构建 共 现 关系 网 络 ,在 此 基础 上 结合 共 现 
网 络 聚 类 ,社会 网 络 分 析 、 神 经 网 络 等 方法 进行 新 兴 技 
术 识别 ( 见 表 3)。 

从 文本 内 容 的 角度 出 发 ,通过 分 析 技术 术语 或 关 
键 词 等 共 现 关系 网 络 ,可 以 发 现 新 兴 技 术 。R. L 
Ohniwa 等 中 提出 一 种 识别 生命 科学 领域 中 新 兴 主 是 
的 方法 ,根据 PubMed. 上 的 MeSH 术语 出 现 的 增长 率 第 
选 出 关键 词 ,通过 共 词 网 络 分 析 将 其 归 类 为 多 个 主题 ， 
将 这 些 主题 定义 为 新兴 主题 ” ,并 进一步 研究 不 同时 
期 关键 词 共 词 网 络 间 的 聚 类 系数 的 差异 。W. H. 
Leer”" 认 为 理解 数据 的 特征 是 探测 新 技术 的 第 一 步 ， 
是 否 能 找到 网 络 的 中 心 取决 于 数据 是 否 具有 无 标 度 网 


络 的 性 质 , 基 于 共 词 网 络 聚 类 结果 ,计算 集群 的 点 度 中 
心性 .中介 中 心性 和 接近 中 心性 ,以 此 推断 新 技术 。 
Y. G. Kim 等 ”基于 专利 文献 挖掘 技术 关键 词 ,通过 
关键 词 共 现 构建 语义 层次 网 络 , 并 根据 语义 网 络 中 每 
个 关键 词 节点 的 最 早 申请 日 期 和 在 专利 文献 中 的 出 现 
频率 ,重新 排列 语义 网 络 的 每 个 关键 词 节点 形成 专利 
地 图 ,进而 发 现 和 预测 新 兴 技 术 。 方 曙 等 ”认为 Y. 
G. Kim 的 方法 具有 操作 简单 .解读 清晰 .主题 凝练 充 
分 等 优点 ,但 存在 循环 论证 之 嫌 . 选 定 的 关键 词 数量 有 
限 .关键 词 - 专利 文档 存在 矩阵 的 赋值 方式 过 于 简单 
化 均值 聚 类 算法 (K-Means) 需 要 事先 确定 聚 类 的 数 
目 等 不 足 。 

部 分 学 者 打破 单一 的 关键 词 聚 类 方法 ,提出 了 共 
现 网 络 分 析 的 改进 思路 。 为 了 有 效 地 从 共 词 网 络 的 时 
间 序 列 中 映射 新 兴 的 研究 趋势 , M，Katsurai 和 S. 
Ono ^ fi tH TrendNets 方法 ,寻找 快速 增长 的 主题 ,而 
不 只 是 受 欢 迎 的 主题 ,即将 各 个 时 间 段 的 共 词 网 络 转 
换 成 单个 矩阵 ,再 将 其 分 解 为 平滑 部 分 和 稀 朴 部 分 :前 
者 代表 静止 词 ,而 后 者 对 应 于 突 发 词 ,采用 Louvain Jy 
法 对 突 发 词 进行 聚 类 并 可 视 化 。J Yoon 等 “1 基于 共 
现 矩 阵 构建 网 络 ,采用 斯 坦 福 依 存 解析 器 提取 形容 词 、 
动词 所 描述 的 属性 和 功能 ,然后 使 用 社会 网 络 分 析 法 
进一步 解释 发 明 属 性 -功能 网 络 (IPFN) 中 指标 的 技术 
EX. N. Choudhury 等 “ 认为 现 有 方法 集中 在 识别 
文献 中 的 关键 词 之 间 的 隐 含 关系 ,而 非 预测 尚未 出 现 
的 关系 ,于 是 提出 了 一 种 基于 关键 词 共 现 网 络 的 动态 
递归 神经 网 络 的 方法 来 预测 新 兴 趋 势 。L，Huang 
等 所 构建 动态 共 词 网 络 , 以 术语 共 现 频次 为 连 边 权 重 ， 
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RI 共 现 网 络 下 新 兴 技术 识别 方法 


研究 文献 研究 问题 节点 关系 强度 方法 
W. H. Leel^!] 通过 共 词 分 析 来 揭示 信息 安全 领域 中 的 新 兴 研 究 关键 词 皮尔 逊 (Pearson) RK, 知识 图 谱 , 社会 网 络 
主题 相关 系数 分 析 
Y. G. Kim 等 [42] 基于 语义 专利 分 析 的 可 视 化 方法 预测 新 兴 技 术 关键 词 / 聚 类 ,关键 词语 义 网 络 , 专 利 


F. Dotsika 和 A. Wat- ”提出 以 文献 为 依据 的 破坏 性 技术 领域 内 新 兴 技术 
kins 32] 的 预测 方法 


J. Yoon 4145] 构建 属性 功能 网 络 ,通过 分 析 小 型 且 高 度 密集 的 子 
识别 技术 创新 趋势 


N. Choudhury 等 146] 基于 动态 递归 神经 网 络 的 方法 来 预测 新 兴 趋 势 


构建 动态 预测 新 兴 技 术 发 展 网 络 的 方法 体系 ,并 转 
绕 新 颖 性 与 影响 力 两 个 维度 识别 新 兴 技 术 主 题 

刘 俊 婉 等 [501 通过 链 路 预测 对 新 兴 主 题 关 联机 会 进行 预测 
Er 利用 专利 文献 提出 识别 新 兴 技 术 主 题 的 初步 技术 


peg DU 


地 图 


关键 词 共 现 频率 关键 词 网 络 分 析 ,可视化 
专利 共 现 频率 自然 语言 处 理 , 共 词 分 析 , 社 
会 网 络 分 析 
关键 词 归 一 化 指数 知识 图 谱 , 文 献计 量 学 ,关键 


字 共 现 网 络 ,递归 神经 网 络 


技术 术语 共 现 余弦 指数 链 路 预测 , 神经 网 络 , 指标 
分 析 

技术 主题 文献 -主题 概率 分 布 LDA 主题 模型 , 链 路 预测 

技术 主题 聚 类 共 词 战略 坐标 分 析 、 共 


词 网 络 分 析 


了 rr HT 


m 
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从 新 突 性 、 增 长 性 一 致 性 和 影响 力 探测 新 兴 


国内 学 者 也 开展 了 相关 研究 , REREN EE 
aga 7 \ 张 维 冲 等 ”构建 主题 词 共 现 网 络 识别 新 兴 技 
术 3B 题 以 及 发 展 趋 势 。 刘 俊 婉 等 "构建 无 向 加 权 共 
afia ,利用 AUC(Area Under ROC Curve) 指标 及 变异 
系数 检验 链 路 预测 算法 各 指标 准确 性 ,最 终 选 取 AA 
(mic-Aqar) 指 标 对 未 来 可 能 产生 关联 的 新 兴 主 题 
进 寡 预测 。 学 者 们 采用 了 不 同 的 实体 共 现 强度 计算 方 
洲 和 L 较 直接 的 方法 是 根据 共 现 频次 来 计算 。 部 分 学 
者 晨 共 现 频次 的 基础 上 做 了 进一步 处 理 ,例如 , 黄 瑞 
AESE 将 共 现 频次 进一步 转化 为 共 现 余 弦 指 数 , 刘 俊 婉 
EPY RH" Scit - 主题 "概率 分 布 计算 主题 间 共 现 强度 。 

以 上 基于 共 现 关系 网 络 的 新 兴 技 术 识 别 研究 , 利 
用 关键 词 .技术 术语 或 主题 构建 共 现 关系 网 络 ,通过 指 
标 分 析 、 社 会 网 络 分 析 、 复 杂 网 络 分 析 和 神经 网 络 算法 
等 方法 识别 新 兴 技 术 。 然 而 ,这 种 方法 也 存在 有 待 改 
进 的 地 方 。 首 先 ,多 数 研究 忽略 了 共 现 关系 强度 或 采 
用 简单 的 共 现 频次 ,缺乏 对 实体 之 间 语 义 关系 和 关系 
强度 的 揭示 。 其 次 ,在 对 关键 词 共 现 网 络 聚 类 分 析 时 ， 
大 多 选取 簇 中 的 高 频 词 来 代表 聚 类 结果 ,这 些 方法 简 
单 直接 ,但 单纯 对 高 频 词 的 统计 分 析 忽略 了 对 词语 本 
身 发 展 变化 的 关注 ,一 些 非 高 频 词 或 者 突 发 词 也 有 可 
能 代表 着 新 兴 技 术 , 却 因 未 达到 频次 筛选 标准 被 忽略 ， 
导致 分 析 结 果 不 够 深入 ,难以 有 效 揭示 领域 的 新 兴 
技术 。 
3.3 ”基于 相似 度 关系 网 络 的 新 兴 技 术 识别 方法 

在 本 文中 ,相似 度 关系 网 络 是 指 以 节点 间 的 相似 


度 关系 为 连 边 的 网 络 。 网 络 的 节点 可 以 具有 不 同 粒 
RE ,例如 以 主题 文档、 句子 或 关键 词 等 作为 节点 ( 见 表 
4) 。 在 构建 相似 度 网 络 关系 时 ,文本 相似 度 是 常用 的 
方法 ,首先 将 节点 文本 转 为 向 量 表 示 ,然后 计算 向 量 之 
间 的 相似 度 ; 也 有 一 些 研究 基于 节点 已 有 关系 (如 引文 
关系 ) 构 建 向 量 进一步 计算 相似 度 关 系 。 

利用 相似 度 网 络 关系 来 分 析 新 兴 技 术 时 ,网 络 节 
点 的 文本 特征 构建 方法 有 : 词 频 、 词 频 - 逆 文 档 频率 
(TF-IDF) 、 词 向 量 \ 句 向 量 等 ,相似 度 计算 方法 有 欧式 
距离 .余弦 距离 等 。B. Yoon 和 站. Park'” 用 每 篇 专利 
文档 的 个 高 频 关键 词 的 出 现 次 数 构成 专利 向 量 , 计 
算 两 两 专利 间 的 欧式 距离 ,并 设置 阔 值 ,以 得 到 清晰 的 
网 络 结构 ,最 后 结合 技术 中 心 指数 .技术 周期 指数 和 技 
术 关 键 词 篮 定 量 指标 ,次 和 分析 高 新 技术 的 最 新 趋势 。 
T. Furukawa 等 选择 TF-IDF 作为 文档 向 量 , 构 建 基 
于 余弦 相似 度 的 会 议论 文 时 序 网 络 , 以 此 分 析 新 兴 
术 的 演化 过 程 。 也 有 学 者 通过 计算 文档 中 句子 结构 的 
相似 性 来 计算 文档 相似 度 ,J，Yoon 和 K. Kim 从 专 
利文 本 中 提取 主 谓 宾 (SAO ) 结构 ,通过 计算 SAO 结构 
之 间 的 语义 句子 相似 度 获 得 专利 相似 性 矩阵 ,并 对 专 
利 相似 度 矩 阵 进行 可 视 化 构建 专利 网 络 , 基 于 节点 度 、 
集群 密度 和 技术 影响 指数 检测 包含 最 新 技术 的 集群 。 
随 着 自然 语言 处 理 技术 的 发 展 ,文本 向 量化 方法 也 更 
加 丰富 。 孔 德 婧 等 ”首先 使 用 BERT 将 专利 文本 向 量 
化 ,构建 专利 语义 相似 度 网 络 ,识别 出 网 络 中 的 离 群 点 
作为 备 选 新 兴 技 术 ; 其 次 ,使 用 DNN 模型 学 习 离 群 专 
利 的 各 项 指标 与 技术 影响 力 大 小 之 间 的 关联 关系 ;最 
后 ,利用 该 关系 模型 预测 当前 年 份 的 离 群 专利 未 来 的 
技术 影响 力 ,发 掘 在 当前 未 被 关注 而 在 未 来 可 能 产生 
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巨大 影响 的 离 群 专利 ,从 而 预测 新 兴 技 术 。 

一 些 研究 在 节点 已 有 共 现 或 引用 等 关系 基础 上 ， 
通过 计算 网 络 节点 间 的 相似 度 关系 筛选 离 群 点 ,这 些 
离 群 点 可 能 具有 新 颖 性 ,以 此 发 现 新 兴 技 术 。K.，Song 
等 ” 从 专利 引用 耦合 网 络 中 通过 相似 度 进行 聚 类 ,得 
到 离 群 专利 作为 候选 新 兴 技 术 , 再 通过 技术 特征 指标 
和 市 场 特征 指标 识别 出 具有 发 展 潜力 的 新 兴 技 术 。 这 
种 方法 为 评估 近期 几乎 没有 引用 信息 的 专利 的 价值 提 
供 了 新 的 思路 。Y. Zhou 等 ”通过 对 专利 引用 耦合 矩 


阵 应 用 余弦 相似 度 来 计算 专利 之 间 的 相似 性 ,将 专利 
网 络 中 的 离 群 专 利 确定 为 候选 新 兴 技 术 , 再 结合 专利 
的 技术 影响 评估 和 网 站 文章 的 社会 影响 评 佑 ,开发 一 
种 基于 深度 学 习 的 新 兴 技 术 识 别 框架 。 也 有 研究 进 一 
步 计算 相 似 度 以 预测 新 兴 技 术 的 演化 关系 。P. Erdi 
等 ”将 专利 之 间 的 相似 度 定义 为 其 引用 向 量 的 欧 几 
里 德 距离 ,并 应 用 只 类 算法 识别 专利 集群 和 探测 集群 
结构 的 时 间 变 化 。 


RA 相似 度 网 络 下 新 兴 技 术 识 别 方法 


研究 文献 研究 问题 节点 关系 方法 
B. Yoon fil 计算 专利 间 的 相似 度 , 并 结合 指标 深入 分 析 高 新 技术 专利 向 量 欧式 距离 相似 度 分 析 ,构建 技术 中 心 指 
Y. Park[5] 的 最 新 趋势 数 ,技术 周期 指数 和 技术 关键 


词 簇 定量 指标 


Furukawa 46054] ”使 用 文本 挖掘 技术 分 析 论 文集 和 会 议 记录 ,分 析 新 兴 会 议论 文 向 量 余弦 相似 度 TF-IDF ,结合 覆盖 范围 .数据 、 
术 的 演化 过 程 连接 和 稳定 性 指标 
> 技术 的 演化 过 程 链接 和 稳定 性 指标 
Soon 和 使 用 基于 SAO 结构 语义 专利 网 络 检测 最 新 技术 的 专利 SAO 结构 Resnik 相似 度 、 SAO 结构 ,相似 度 分 析 , 网 络 
im[55] 集群 匹配 平均 值 可 视 化 
psc 构建 专利 语义 相似 度 网 络 ,识别 网 络 中 的 离 群 点 作为 专利 向 量 余弦 相似 度 BERT 文本 向 量化 ,DNN 模型 
- 备 选 新 兴 技 术 , 使 用 DNN 模型 学 习 离 群 专利 的 指标 
e 与 技术 影响 力 大 小 之 间 的 关系 ,利用 该 关系 模型 预测 
er 新 兴 技术 
(us 等 [57] 对 专利 引用 耦合 网 络 通过 相似 度 进行 聚 类 ,得 到 离 群 专利 基于 耦合 的 余弦 RK ,指标 分 析 
e 专利 作为 候选 新 兴 技 术 ,通过 技术 特征 指标 和 市 场 特 相似 度 
N 征 指标 识别 新 兴 技 术 
Cn 等 [58] 结合 专利 的 技术 影响 和 网 站 文章 的 社会 影响 ,开发 深 专利 基于 耦合 的 余弦 异常 检测 (相似 度 分 析 ), 指 
CN 度 学 习 框 架 用 于 识别 大 范围 离 群 专利 中 的 新 兴 技 术 相似 度 标 分 析 , 深度 学 习 
Pprdi 等 [59] 基于 引用 向 量 计算 相似 性 度量 ,采用 聚 类 算法 预测 新 专利 引用 向 量 TS 定义 引用 向 量 , 凝 聚 法 分 层 聚 
n usen 技术 集群 类 (WARD ) 


6G 基 于 相似 度 关系 的 相关 研究 主要 采用 SAO 结构 、 
TISIDF 算法 .LDA 主题 模型 .BERT 模型 等 进行 文本 表 
Te n 
离 或 相似 度 度量 ,结合 指标 分 析 、 机 器 学 习 、 深 度 学 习 
和 可 视 化 等 方法 进行 新 兴 技 术 识别 。 虽 然 基于 语义 的 
相似 度 计 算 方法 更 加 精确 ,可 以 准确 拟 合 出 复杂 指标 
与 结果 之 间 的 关系 ,然而 存在 运算 效率 低 .解释 性 弱 ， 
无 法 深入 挖掘 各 指标 对 结果 的 影响 机 制 等 问题 。 单 纯 
的 低 相似 度 关系 也 不 能 完全 证 明 是 新 兴 技术 ,基于 语 
义 分 析 的 新 兴 技 术 识 别 需要 进一步 深入 研究 ,弥补 外 
部 特征 在 语义 表达 方面 的 不 足 ,进一步 提升 新 兴 技术 
识别 的 准确 性 。 
4 网 络 视角 下 新 兴 技 术 识别 述评 

上 述 三 类 基于 关系 网 络 的 新 兴 技 术 识 别 方法 ,确定 
网 络 节点 .构建 网 络 关系 、 网 络 分 析 方法 与 指标 是 其 中 


的 重要 环节 ,因此 本 文 从 相对 应 的 多 源 节点 、 多 元 关系 、 
多 维 指标 三 个 方面 总 结 现 有 研究 ,并 提出 改进 建议 。 


4.1 多 源 数据 节点 

文献 调研 发 现 ,新 兴 技 术 识 别 的 网 络 节点 多 局 限 
于 论文 和 专利 数据 ,在 大 多 数 情况 下 ,采用 单一 数据 作 
为 研究 对 象 ,对 基金 等 其 他 数据 关注 较 少 。 新 兴 技 术 
包含 了 时 间 和 技术 两 个 维度 的 内 容 , 而 论文 和 专利 文 
献 信息 的 及 时 性 全面 性 .持续 性 .新 颖 性 、 创 新 性 等 特 
征 可 覆盖 新 兴 技 术 的 基本 特征 ,因此 论文 和 专利 数 
据 也 成 为 新 兴 技 术 识 别 研究 中 最 常见 的 数据 类 型 。 

但 由 于 新 兴 技 术 具 有 和 较 高 的 不 确定 性 和 模糊 性 ， 
单一 数据 分 析 可 能 不 足以 了 解 技术 产生 扩散 和 演化 
的 整个 周期 。 因 此 ,学 者 们 开始 关注 利用 多 源 异 构 数 
据 进行 新 兴 技术 识别 ,通过 对 不 同 来 源 . 不 同类 型 .不 
同 结构 的 信息 进行 综合 分 析 .交叉 验证 ,保证 识别 结果 
的 有 效 性 。 例 如 , 张 浩 "将 学 术 论 文 .专利 数据 .商业 
数据 进行 数据 融合 研究 ,来 提升 技术 预测 的 效果 ; 张 维 
冲 等 ”基于 专利 ,期 刊 论文 .学 位 论文 .会 议论 文 .图 
书 、 基 金 项 目 \ 行 业 报 告 7 种 不 同 的 科技 文献 类 型 , 提 
出 了 基于 摘要 的 主题 解析 方法 ,从 多 源 异 构 文本 中 获 
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取 主 题词 ,进行 数据 融合 与 主题 关联 分 析 ,并 以 区 块 链 


| 技术 为 例 进行 验证 ,如 表 5 所 示 : 


表 5 新 兴 技 术 识 别 的 数据 源 


数据 组 合 数据 类 型 研究 领域 代表 性 研究 TU 
TED nd 机 器 人 、 生 物 、 干 细 董 放 等 [911 Web of Science 数据 库 
a aps Len] 
草 艺 文 等 [21] 
专利 纳米 领域 .图 像 识 ppg "— 
MAKRA 0 罗 建 等 [9 Orbit Ripe 
宋 欣 娜 等 [9] 德 温 特 专利 数据 库 
基金 石墨 烯 领域 .人 工地 静 等 [G] 美国 国家 科学 基金 会 .欧盟 地 平 线 2020 计划 ,英国 国家 科研 与 创新 
iis PRLS 署 与 英国 工程 与 自然 研究 理事 会 
多 源 数据 论文 .专利 机 器 人 、 电 动 汽车 周 源 等 [@7] Web of Science 数据 库 .Thomson Innovation 专利 数据 库 .万 方 数据 库 
任 智 军 等 和 中 国 国家 知识 产权 局 专利 检索 系统 
dd 智能 网 联 汽车 唐 恒 等 的] Incopat 数据 库 .CNKI .CSDN 博客 
a 张 维 冲 等 [49] 大 为 innojoy 专利 搜索 引擎 .CNKI. 国 家 图 书馆 馆藏 目录 查询 系统 、 
金 项 目 ,行业 报告 自然 科学 基金 查询 LetPub 系统 .中文 互联 网 数据 资讯 中 心 


二 虽然 已 有 研究 尝试 综合 不 同类 型 的 科技 文献 数据 
进 夸 新 兴 技术 识别 ,但 由 于 异 构 数据 在 文本 结构 形式 
属性 特征 上 存在 差异 , 现 有 研究 在 利用 多 源 数 
开行 新 兴 技 术 识别 方面 稍 显 欠缺 ,尤其 是 通过 多 源 
网 络 分 析 探究 不 同类 型 数据 间 的 关系 ,从 而 识别 新 兴 
接 术 。 此 外 ,数据 的 及 时 性 对 于 新 兴 技 术 识 别 来 说 至 
导 要 ,例如 知识 生成 与 出 版 和 传播 日 期 之 间 可 能 存 
在 特大 的 延迟 ,仍然 是 一 个 令 人 关切 的 问题 。 
4G 多 元 网 络 关系 

“实体 之 间 有 具有 不 同 的 关联 方式 ,因此 网 络 构建 广 
法 末 同 ,同时 网 络 中 节点 之 间 的 连 边 权重 反映 不 同 主 
题 之 间 的 关联 程度 。 网 络 中 实体 间 的 关联 方式 主要 有 
引 焊 关系 、 共 现 关系 .相似 度 关系 等 ( 见 表 6) 。 

.己基 于 引用 关系 的 新 兴 技 术 识 别 方法 是 关系 网 络 视 
角 (BB 最 常见 的 方法 。 引 用 关系 直观 地 展现 实体 间 发 生 
的 知识 交流 活动 ,通过 时 序 网 络 间 的 技术 到 类 演化 过 
程 特征 来 判定 技术 的 发 展 趋势 ,如 技术 艇 的 出 现 、 融 
f ,分裂 ,衰减 等 ,与 其 他 两 种 网 络 相 比 具有 更 好 的 解 
释 力 。 该 方法 多 以 论文 为 节点 ,以 引用 关系 为 连 边 构 
建 无 权 有 向 网 络 ,跳出 了 共 现 关系 网 络 和 相似 度 关系 
网 络 所 面 对 的 微小 知识 单元 。 但 该 方法 存在 引用 灌 后 
性 问题 ,节点 表示 粒度 较 粗 , 且 缺 乏 融 合 文献 语义 特征 


构建 加 权 网 络 以 更 准确 地 识别 新 兴 技 术 。 

相 比 引用 关系 网 络 , 共 现 关系 网 络 弥 补 了 其 时 间 
滞后 问题 和 忽略 文本 内 容 特 征 的 不 足 。 共 现 关 系 可 以 
看 作为 一 种 横向 的 实体 关联 ,可 以 发 现 交叉 学 科 领 域 
的 新 兴 技 术 。 基 于 共 现 关系 的 新 兴 技 术 识别 方法 多 以 
关键 词 ,术语 或 主题 为 节点 ,以 共 现 关系 为 连 边 构建 无 
向 加 权 网 络 , 相 比 引用 关系 网 络 ,节点 的 粒度 更 细 , 更 
加 注重 实体 间 的 语义 关系 。 但 同时 该 方法 对 节点 单元 
的 确定 (关键 词 的 选择 .主题 抽取 结果 ) 、 共 现 关系 强 
度 计算 方法 具有 较 强 的 敏感 性 , 共 现 网 络 聚 类 结果 不 
明确 也 会 对 新 兴 技 术 识 别 结 果 产 生 较 大 影响 。 

基于 相似 度 关系 的 新 兴 技 术 识 别 方法 多 以 文本 向 
量 为 节点 ,以 相似 度 关系 为 连 边 构建 无 向 加 权 网 络 , 其 
中 文本 向 量化 表示 方法 丰富 多 样 ,根据 粒度 大 小 不 同 
分 为 字 、 词 ,句子 或 篇 章 等 层次 。 该 方法 利用 文本 挖掘 
算法 ,从 不 同 粒 度 剖 析 文 本 内 部 的 语义 信息 ,弥补 了 引 
用 分 析 、 关 键 词 分 析 在 语义 关联 上 的 不 足 , 结 合 时 序 关 
联 描述 技术 演化 关系 。 这 种 方法 更 好 地 面向 预测 场 
景 ,通过 将 新 兴 技 术 识 别 问题 转化 为 寻找 能 够 有 效 代 
表 新 兴 技 术 特 征 的 维度 并 在 此 基础 上 构建 模型 的 问 
题 ,从 而 更 具 前 脆性 地 预测 新 兴 技 术 的 涌现 "| 。 


表 6 基于 关系 网 络 的 新 兴 技 术 识 别 方法 
关系 特点 


适用 场景 


引用 关系 常 应 


聚 类 方法 识别 技术 主题 ,利用 数量 趋势 进行 预测 ,但 存在 时 间 滞 后 性 , 专 


最 常见 的 基于 网 络 科学 的 新 兴 技 术 识别 方法 ,纵向 的 知 


利 或 论文 等 文本 之 间 的 内 部 关系 较为 欠缺 


识 流动 ,刻画 了 技术 的 发 展 路 径 


共 现 关系 多 以 术语 或 关键 词 为 节点 , 相 比 共 现 关 系 ,在 技术 主题 语义 表达 方面 更 细 粒 度 ; 


横向 的 知识 关联 ,发 现 交 又 学 科 领 域 的 新 兴 技 术 


避免 了 引用 关系 的 时 间 积 累 局 限 ,便于 早期 识别 新 兴 主 题 


相似 度 关系 ” ”利用 文本 挖 抉 方法 ,从 不 同 粒度 剖析 文本 内 部 的 语义 信息 ,弥补 了 引 


分 析 、 关 ”以 低 相 似 度 关系 或 在 已 有 关系 基础 上 计算 相似 度 预 测 


键 词 分 析 在 语义 关联 上 的 缺失 ,结合 时 序 关联 描述 技术 演化 关系 
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本 文 从 引用 、 共 现 、 相 似 度 关系 网 络 角 度 对 当前 间 
兴 技 术 识 别 的 研究 方法 进行 梳理 总 结 ,发 现 早 期 的 研 
究 多 是 基于 引用 关系 网 络 ,之 后 为 克服 引文 方法 的 缺 
陷 逐 渐 发 展 了 共 现 关系 和 相似 度 关系 网 络 。 现 有 研究 
仍 以 单一 关系 为 主 , 而 且 在 分 析 网 络 以 从 中 识别 新 兴 
技术 时 思路 较为 相似 ,多 采用 网 络 聚 类 分 析 方 法 ,结合 
数据 外 部 特征 分 析 技术 主题 的 新 兴 和 发 展 。 此 外 ,在 
结果 解读 方面 ,复杂 的 网 络 关系 可 能 无 法 提供 有 关 技 

表 7 


具体 指标 


术 领 域 的 直观 见解 , 仍 需 专家 解读 。 因 此 ,如 何 构建 多 
元 关系 网 络 , 又 采用 何 种 手段 从 网 络 中 挖掘 其 中 的 新 
兴 技 术 , 以 及 如 何 提 高 复杂 网 络 的 可 解读 性 ,是 未 来 需 
要 解决 的 重点 问题 。 
4.3 ”多维 指标 体系 

综合 分 析 现 有 的 指标 体系 , 主要 包括 文献 计量 学 
指标 和 网 络 特征 指标 两 个 方面 ,如 表 7 所 示 : 


新 兴 技 术 识 别 指标 和 特征 


特征 


文献 计量 学 指标 论文 :论文 数量 ,期 刊 数量 \ 作 者 数量 、 被 引 频 次 以 及 增长 率 等 


技术 的 创新 性 新颖 性 \ 相 对 增长 性 ,影响 性 ,持续 性 与 集聚 性 等 


专利 :专利 数量 IPC 类 别 、 专 利家 族 平均 成 员 数 ,被 引 频次 以 及 增长 率 等 


基金 :基金 数量 ,资助 金额 .开始 日 期 及 结束 日 期 等 
喘 络 特征 指标 。 网 络 节点 度 值 . 网 络 中 心性 网 络 聚集 系数 相似 性 指标 等 


(@ 文 献计 量 学 指标 重点 关注 技术 的 发 展 状态 和 潜在 
的 发 展 趋势 ,目前 文献 计量 学 指标 主要 考量 了 新 兴 
术 的 创新 性 ,新颖 性 相对 增长 性 .影响 性 与 延续 性 , 具 
体 指标 包括 各 个 主题 的 词 频 变化 率 ,论文 数量 ,期刊 数 
旺 夫 人 金 数量 ,作者 数量 ` 被 引 频次 以 及 增长 率 等 。 有 
党 项 进一步 采用 多 指标 融合 测度 ,如 主题 演化 偏离 度 ， 
Ry x: oct .主题 被 引 频 次 .主题 生存 周期 计算 
主题 新 颖 度 和 主题 强度 , 取 两 者 综合 曲线 焦点 ,可 以 反 
映 宇 题 的 “新 ”与 “ 兴 ”" ;如 新 兴 分 数 (EScore) ,筛选 
答 众 持久 性 .新颖 性 .增长 性 .社区 性 和 范围 性 标准 的 
ASIE] ERAH EScore, 形 成 识别 新 兴 技 术 的 一 套 指 
PRES, 一些 特殊 的 文献 计量 学 指标 体现 了 不 同类 型 
数 锯 所 独 有 的 内 外 部 文本 特征 ,例如 专利 数据 具有 
IPC .专利 家 族 成 员 等 特征 ,分 别 采用 IPC 类 别 数 和 专 
利家 族 平均 成 员 数 表征 技术 创新 性 和 影响 性 'H。 此 
外 ,基金 项 目 具 有 独特 的 资助 金额 .开始 日 期 及 结束 日 
期 等 特征 。 

网 络 特征 指标 则 指 利用 技术 主题 关系 网 络 的 节点 
特征 、 连 边 特征 或 整体 结构 特征 ,包括 网 络 节点 的 平均 
度 值 .中 心性 分 析 ( 度 中 心性 接近 中 心性 .中 介 中 
心性 ) WARES 、 网 络 聚集 系数 5 等。 例如, 针 
对 持续 性 ,判定 方法 主要 是 测量 网 络 中 的 关键 词 或 作 
者 在 子 群 结构 上 是 否 存在 局 部 密集 及 箭 增 的 趋势 。 
黄 瑞 等 5 认为 技术 主题 影响 力 体现 了 该 技术 在 整个 
技术 网 络 中 的 重要 程度 ,选取 了 网 络 中 心性 指标 Pag- 
eRank 指标 测度 技术 主题 的 影响 力 。T. S. Cho 和 H. 
Y. Shih ^ 认为 具有 结构 洞 的 专利 类 ,其 通常 是 子 组 之 


* 


技术 的 新 颖 性 .影响 性 .持续 性 等 


间 的 重合 专 利 类 别 ,具有 大 量 的 技术 流动 机 会 和 重要 
的 技术 位 置 ,因此 通过 测量 结构 洞 来 识别 IPC 类 别 中 
的 潜在 新 兴 技术 。 

总 体 来 看 ,目前 已 有 的 指标 体系 主要 以 新 兴 技 术 
的 特征 为 依据 进行 技术 识别 和 预测 ,文献 计量 学 指标 
多 利用 论文 ,专利 等 统计 数据 ,建立 在 文献 计量 .专利 
分 析 等 情报 研究 方法 基础 上 。 网 络 结构 特征 指标 的 研 
究 相 对 而 言 较 少 ,这 类 指标 的 可 解释 性 不 如 文献 计量 
学 指标 ,在 利用 网 络 结构 特征 和 属性 等 去 挖掘 新 兴 技 
术 方 面 仍 有 较 大 的 探索 空间 。 大 多 研究 仅 基于 文献 外 
部 特征 的 单 维 分 析 ,单一 测度 指标 可 能 不 能 准确 地 识 
别 出 新 兴 技 术 ,并且 在 识别 过 程 中 常常 过 度 依赖 专家 
判断 。 此 外 , 现 有 的 指标 体系 是 针对 不 同 的 领域 和 数 
据 类 型 提出 ,所 以 新 兴 技 术 测度 指标 体系 各 不 相同 , 表 
现 出 对 新 兴 技 术 的 测度 不 统一 ,导致 指标 体系 主观 性 
较 强 ,是否 科 学 和 合理 有 待 进一步 验证 。 例 如 有 的 强 
调 高 关注 度 .影响 力 ,忽略 了 时 间 上 的 新 ,对 新 兴 技 术 
本 身 的 创新 性 分 析 不 足 ; 有 些 指标 在 新 兴 技 术 早 期 难 
测度 ,如 通过 引用 频次 测度 影响 力 会 造成 此 类 偏差 。 
4.4 ”新 兴 技 术 识 别 方法 展望 

近年 来 ,基于 关系 网 络 的 新 兴 技术 识别 研究 产生 
了 多 项 成 果 , 但 随 着 新 兴 技 术 关 系 复 杂 性 的 增加 , 目前 
该 领域 的 研究 依然 存在 可 进一步 改进 的 空间 ,具体 
如 下 : 

首先 ,未 来 可 考虑 融合 多 种 反映 或 影响 新 兴 技 术 
形成 和 发 展 的 数据 源 ,包括 论文 专利、 基金 项 目 、 政 
策 、 商 业 ( 行 业 报告 等 ) 媒体 与 情 ( 新 闻 、 社 交工 具 等 ) 
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等 。 在 构建 多 源 数 据 网 络 时 ,采用 Node2vec , BERT 等 
向 量 表示 方法 将 多 源 异 构 数据 同 构 化 ,转化 成 文档 或 
主题 粒度 的 实体 作为 关系 网 络 的 节点 。 其 次 ,可 利用 
实体 间 的 引用 、 共 现 、 相 似 等 多 元 关系 构建 动态 关系 网 
络 。 再 次 ,可 将 不 同 数据 源 分 别 构建 的 关系 网 络 ,借鉴 
知识 网 络 中 对 齐 方法 进行 网 络 融 合 ,并 把 数据 特征 融 
入 网 络 的 节点 或 连 边 的 权重 中 。 最 后 ,采用 复杂 网 络 


住 新 兴 技 术 的 概念 和 特征 ,理解 新 兴 技 术 的 涌现 过 程 
和 形成 机 制 ,更 有 效 地 开展 新 兴 技 术 识别 和 预测 。 

也 就 是 说 ,将 论文 .专利 基金 等 多 源 异 构 数据 转 
化 表示 为 合适 粒度 的 实体 作为 网 络 节点 ,基于 引用 、 共 
现 \ 相 似 关系 等 构建 动态 多 元 关系 网 络 , 综 合 数据 特 
征 技术 特征 和 网 络 结构 特征 进行 网 络 融合 分 析 , 即 分 
别 从 数据 层 ,关系 层 、 网 络 层 进行 融合 ,有 效 提升 新 兴 


力 


分 析 、 机 器 学 习 、 图 神经 网 络 等 算法 挖掘 关系 网 络 , 抓 | 技术 识别 的 准确 性 。 如 图 2 所 示 : 
| messe | | xamma Ws t 
x PE O Deea] | [ me Je 
DU 数 | 数 | 
le a 据 | 网 | 
EIDEM (ex) o| 型 | | 共 现 关系 CO 系 | | mae [C » : 
T a HI j 
> i (em mxx&|c»| | ma > 
-t 9^ oE 
N | 
e EE  — MAUMEM. GOGUMME MAREM 
ep o E d cu ae 
图 2 基于 多 源 数据 和 多 元 关系 的 融合 网 络 的 新 兴 技 术 识别 
Qer, 由 于 基金 .论文 .专利 等 数据 是 处 于 不 同 研 (FUSE) [ EB/OL]. [2021 -11 - 10]. https://www. iarpa. 
究 阶段 的 成 果 ， 不 同 数据 的 滞后 时 间 不 同 ; 对 技术 识别 gov/ index. php/research-programs/fuse. 


MIT IERI IST E, E e] — B He 3c 
Fic RI APR PU dE EG FEAT dr UB UR 
多 名 关系 融合 网 络 开展 新 兴 技术 识别 时 ,还 要 尤其 注 
意 候 述 问题 。 此 外 ,对 于 不 同 的 技术 领域 ,方法 的 可 扩 
展 笨 可 能 有 所 欠缺 ,可 进一步 进行 国际 比较 或 行业 间 
比较 分 析 。 


5 结语 


通过 对 国内 外 网 络 视角 下 的 新 兴 技 术 识 别 研 究 的 
梳理 ,本 文 将 基于 关系 网 络 的 新 兴 技 术 识别 研究 分 为 
基于 引用 关系 、 基 于 共 现 关系 、 基 于 相似 度 关系 三 类 ， 
并 分 别 从 网 络 节点 、 网 络 关系 .指标 体系 等 方面 分 析 了 
现 有 人 研究 的 特点 与 问题 。 未 来 在 明确 新 兴 技 术 的 内 涵 
特性 和 发 展 过 程 的 基础 上 ,可 以 借助 深度 学 习 、 自 然 语 
言 处 理 等 技术 手段 ,有 效 融 合 论文 .专利 和 基金 等 多 源 
异 构 文 本 内 容 , 构 建 动态 多 元 关系 融合 网 络 ,在 新 兴 技 
术 识 别 方面 做 出 新 的 突破 。 
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Abstract: | Purpose/Significance | Emerging technology identification helps countries and enterprises to grasp 
the technological frontier, discover technological opportunities, seize market opportunities and create social value. 
This paper reviews the research progress of emerging technology identification, and provides a reference for the study 
of emerging technology identification. | Method/Process | On the basis of clarifying the concepts and characteristics 
of emerging technology , this paper introduced the identification methods of emerging technologies based on relational 
networks in detail, summarized the network nodes, network relationships and measurement indicators of emerging 
technology identification, and made recommendations for the future study of emerging technology identification. | Re- 
Tt/ Conclusion | The identification methods of emerging technology based on relational networks include the meth- 
based on citation relationships, co-occurrence relationships , and similarity relationships. The network nodes of e- 
Gfierging technology identification are mainly from papers and patents data. The existing indicator system includes bib- 


l'tometric indicators and network structure characteristic indicators. In the future , the study of emerging technology i- 


tification can be improved from the aspects of enriching data sources, integrating network relationships and meas- 


ps in emerging technology identification should be strengthened. 
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